Skip to main content

EMR

Add-step Example

aws emr add-steps \
--cluster-id $CLUSTER_ID \
--steps '[{
"Name": "Example PySpark Job",
"Type": "Spark",
"ActionOnFailure": "CONTINUE",
"Args": [
"--deploy-mode", "cluster",
"--master", "yarn",
"--jars", "s3://path/to/definity-spark-agent-X-X.jar",
"--conf", "spark.plugins=ai.definity.spark.plugin.DefinitySparkPlugin",
"--conf", "spark.definity.server=https://app.definity.run",
"--conf", "spark.definity.api.token='$DEFINITY_API_TOKEN'",
"--conf", "spark.definity.env.name=demo",
"--conf", "spark.definity.pipeline.name=example_pipeline",
"--conf", "spark.definity.pipeline.pit=2024-12-10",
"--conf", "spark.definity.task.name=example_task",
"--conf", "spark.executor.memory=3g",
"--conf", "spark.executor.cores=3",
"s3://path/to/task.py"
]
}]'

Compatibility matrix

EMR ReleaseSpark VersionScala VersionDefinity Agent
7.10.03.5.52.12.183.5_2.12-latest
7.9.03.5.52.12.183.5_2.12-latest
7.8.03.5.42.12.183.5_2.12-latest
7.7.03.5.32.12.183.5_2.12-latest
7.6.03.5.32.12.183.5_2.12-latest
7.5.03.5.22.12.183.5_2.12-latest
7.4.03.5.12.12.183.5_2.12-latest
7.3.03.5.12.12.183.5_2.12-latest
7.2.03.5.02.12.173.5_2.12-latest
7.1.03.5.02.12.173.5_2.12-latest
7.0.03.5.32.12.173.5_2.12-latest
6.15.03.4.12.12.153.4_2.12-latest
6.14.03.4.12.12.153.4_2.12-latest
6.13.03.4.12.12.153.4_2.12-latest
6.12.03.4.02.12.153.4_2.12-latest
6.11.13.3.22.12.153.3_2.12-latest
6.11.03.3.22.12.153.3_2.12-latest
6.11.13.3.22.12.153.3_2.12-latest
6.10.13.3.12.12.153.3_2.12-latest
6.10.03.3.12.12.153.3_2.12-latest
6.9.13.3.02.12.153.3_2.12-latest
6.9.03.3.02.12.153.3_2.12-latest
6.8.13.3.02.12.153.3_2.12-latest
6.8.03.3.02.12.153.3_2.12-latest
6.7.03.2.12.12.153.2_2.12-latest
6.6.03.2.02.12.103.2_2.12-latest
6.5.03.1.22.12.103.1_2.12-latest
6.4.03.1.22.12.103.1_2.12-latest
6.3.13.1.12.12.103.1_2.12-latest
6.3.03.1.12.12.103.1_2.12-latest
6.0.12.4.42.12.102.4_2.12-latest
6.0.02.4.42.11.122.4_2.11-latest